為什麼我們需要 dbt?我們真的需要它嗎?
今天又在 Medium 看到這篇 No, Data Engineers Don’t NEED dbt.,在談論到底需不需要 dbt。
近年在資料領域會一直看到各種討論,很多人吹捧 dbt 的強勢之後,又會有人緊跟上來說過譽,基本上什麼領域、什麼話題,應該都會遇到很類似的情況。很多時候在決策階段,吸收了過多的資訊,反而會迷失其中。
很唐突地,跟大家推薦最近看的一本書—『選擇的弔詭:選錯,沒你想的糟!』裡面就提到雖然總是會說選擇越多,越自由,但過多的選擇其實會帶來反效果,讓人無論在選擇前後都提心吊膽擔心自己做錯或錯過。
在 dbt 這一題,我覺得重點是要回歸本質,看看團隊的資料架構,以及團隊的資料服務的群眾、需求、目的等。
如果想要高大上一點,可以往高層次、更抽象的議題來思考:
找出團隊真正關注的議題,評估原先的資料處理模式與導入 dbt 的差異、優劣勢,以及導入的人力成本等。
不過其實我更喜歡思考一些白話版本的問題,我覺得白話版本的問題更能幫助我推進思考,當然可以在想完之後再包裝一下,讓問題看起來更精緻:
在思考的過程中,可以更專注於發掘 dbt 的特典,套用回團隊現在的狀況,像是:
提了幾個思考點作為範例,dbt 的優點並不是決定要使用就會出現的,就像遊戲中也沒有全能的裝備,不同的角色會有最適合自己的裝備,要去評估戰況、評估裝備的特點,才能去選擇最適合自己的裝備。
在導入 dbt 的過程中,不敢說跟當初的想像一模一樣(畢竟這個系列文章就是在講跟當初想像不一樣的部分XD),但至少在方向上,有往我們期待的理想前進一大步。